iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 14
1
AI & Data

飛哥與小博的30天-統計與機器學習成長日記系列 第 14

[DAY 14] 統計雜談: B董的午餐會 - P-value重要嗎?

  • 分享至 

  • xImage
  •  

番外篇 B董的午餐會

連續回答完兩位同仁的問題後,B董看時間也差不多到中午了,因此決定先用餐後小歇一會,下午再繼續讓最後的士心協理詢問,B董命秘書將準備好的午餐拿出來,稍後,一輛精緻的小餐車被推了出來,小博看到上面滿滿的道地美食不由得驚呼起來。

「哇!這不是『結霜橋』的叻沙嗎,這家還保留傳統炭爐的煮法,採用的細米粉能沾附更多的湯汁。旁邊還有沙嗲、咖椰吐司、肉骨茶,都是台灣不常吃到的味道呢!上次我在餐廳吃的叻沙,幾乎沒有香料的味道,沒想到這邊的可以這麼香呢!」小博憑藉著事前上網作功課,提前預習新加坡的道地美食。

B董笑著說:「小弟弟很厲害啊,你竟然可以直接分辨這是『結霜橋』的招牌,平常去買這個基本上都是要排隊的。」轉頭對飛哥說:「你的助理挺懂吃的啊!不錯不錯,哈哈哈!」,飛哥笑而不語。

「倒是你剛剛做分析時提到的P-value,這個該怎麼看比較好啊?是愈小愈好嗎?」B董突然話鋒一轉問道。

「P-value啊!通常大家都會說『P-value < 0.05』就代表有顯著,這個顯著你可以想像成『達到統計上的差異』。在常態分布中的95%是聚集在中間佔大多數的數值,剩下的5%也就是我們P-value訂定的數字(分別佔左右各2.5%),表示說這個5%其實是屬於非正常狀況下的數值,大部分的數值都在中間的時候,這時我們的數值卻坐落在邊邊時,就夠知道兩者確實有差異」飛哥咬了一口沙嗲,嚼完吞下後繼續說著。

https://ithelp.ithome.com.tw/upload/images/20200930/20130640HKl3O14Cyg.png

「像我剛剛做的回歸中,有些參數的P-value < 0.05,表示這個參數對解釋模型很有幫助;相反的,若參數的P-value > 0.05,有兩種可能

1. 該參數確實對模型的解釋沒有幫助
2. 該參數的樣本不夠多,導致P-value無法精準表現出參數的差異

如果你的樣本夠多的話,就有比較高的可能性讓P-value < 0.05,所以說足夠的樣本也很重要啊!」飛哥繼續說著。

B董這時問了個問題:「那各個領域都是用0.05這個數值做為參考嗎?」

「這就不一定了,0.05比較像是大家約定俗成的數值,其時我在醫學界也有看到有人使用0.1作為顯著的參考界線,也有人避免有誤差而設定0.01,但大部分還是設定0.05做為參考。」講完後飛哥順勢喝了口肉骨茶湯。

「喲!挺不錯的嘛!看來你還跨足到其他領域,也涉略不少領域知識呢!等等吃飽後休息下吧,慢吃慢吃。」B董起了身到隔壁的休息室休息去。


資料參考:
https://medium.com/@chih.sheng.huang821/%E7%B5%B1%E8%A8%88%E5%AD%B8-%E5%A4%A7%E5%AE%B6%E9%83%BD%E5%96%9C%E6%AD%A1%E5%95%8F%E7%9A%84%E7%B3%BB%E5%88%97-p%E5%80%BC%E6%98%AF%E4%BB%80%E9%BA%BC-2c03dbe8fddf
https://service.mohw.gov.tw/MOHW_Upload/dmc_history/UpFile/Period33/%E5%AF%A6%E7%94%A8%E5%AF%A6%E8%AD%89%E9%86%AB%E5%AD%B8%EF%BC%8C%E5%A6%82%E4%BD%95%E5%88%A4%E8%AE%80%E7%B5%B1%E8%A8%88%E6%AA%A2%E5%AE%9A-p%E5%80%BC%E7%9A%84%E8%BF%B7%E6%80%9D.pdf


上一篇
[DAY 13] 章節2-9: 安眠藥客群的設定-羅吉斯回歸(Python)
下一篇
[DAY 15] 統計雜談: 午間斜陽-統計有甚麼用?
系列文
飛哥與小博的30天-統計與機器學習成長日記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言